iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 20
0
Google Developers Machine Learning

文組腦的機器學習異想世界系列 第 20

【Day20】文組腦介紹特徵工程

  • 分享至 

  • xImage
  •  

哈囉大家好~~~~
現在我們知道可以使用Google Cloud Platform和Cloud Machine Learning Engine去訓練我們的機器學習模型,但我們還需要有很重要的東西,就是我們的數據或是數據的特徵,無法對數據進行基本分析,就無法進行機器學習了。因此,接下來我們要介紹特徵工程(Feature Engineering),怎麼樣的特徵是適合輸入到你的機器學習模型的好的特徵呢?或是我們可以創造出一些並不是原本數據集中包含的綜合特徵(像是將某幾欄數據做加總成為新的特徵),創造良好的特徵或綜合特徵被稱為預處理。
好的特徵可以幫助ML的表現更好,我們要先想想我們要解決的問題是甚麼?將你要解決的問題作為你的最終目標,根據你的最終目標是建立一個模型,舉例來說,如果我們目標是預測房屋價格,我們要先要了解有那些跟房子有關的數據,例如:房子大小、土地大小、房間數或位置等。好的特徵工程平均會花費整個ML任務時間的50%到75%,所以特徵工程是很重要又費時的。

以上,那我們明天見~~~~


上一篇
【Day19】文組腦理解Google Cloud Platform監督ML的運作
下一篇
【Day21】文組腦告訴你什麼是好的特徵
系列文
文組腦的機器學習異想世界30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言